查看原文
其他

最大多样性和 Zipf 定律 | 复杂性科学顶刊精选6篇

集智俱乐部 集智俱乐部 2022-05-09

集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。


扫描下方二维码,关注“集智斑图”服务号,即可订阅Complexity Express:             



Complexity Express 一周论文精选




以下是2021年8月9日-2021年8月15日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~

目录:

1. 最大多样性和 Zipf 定律

2. 从神经形态学网络结构中学习功能
3. 马尔可夫链和网络块模型中的状态聚合
4. 从大流行出现到地方性转变的人口学特征的一般模型
5. 多感觉神经元如何解决因果推理
6. 量化复杂网络的可压缩性


1.最大多样性和Zipf定律


论文题目:Maximal diversity and Zipf’s law期刊来源:Physical Review Letters论文地址:https://journals.aps.org/prl/accepted/7b070Y07P5d1d985c3fd28740e49abf8621e9ce20

多样性是生态学、经济学、信息论以及其他自然和社会科学的中心概念,高度的多样性可能反映了系统在韧性和效率方面的优势。例如,人们通常认为具有多样性的生态系统更稳定,国家有非常多样化的生产线自然也会更强大。在大多数情况下,多样性受到多种限制因素的影响。对于一个生态系统来说,现有的资源数量不会允许人口无限制地增长。同样,一家企业能否生产多样的产品也会受其实力的限制。因此,多样性的增长是一个复杂的优化过程。

近日,Physical Review Letters 的一篇文章里提出多样性指数的概念,并证明了多样性指数的最大值与系统元素分布中的Zipf定律的出现是自然相关的。研究者将推导结论在定量语言学的背景下进行检验,结果显示与从古腾堡英语文本数据库中获取到的数据有显著的一致性。最后,研究者们还以一种简单的方式恢复了Heaps法则的表达式,并讨论了它与多样性法则的关系。

图1.古腾堡英语文本数据中多样性指数和数据量的关系。


2.从神经形态学网络结构中

学习功能


论文题目:Learning function from structure in neuromorphic networks期刊来源:Nature Machine Intelligence论文地址:https://www.nature.com/articles/s42256-021-00376-1

大脑中的神经元依照复杂的连接模式共同组成了一个复杂网络。网络中的集体信号表现为模式化的神经活动,为人类的认知与适应性行为提供了支持。随着技术进步,人们可以对生物的大脑网络进行宏观的重构,这些被称为连接组(connectome)的映射表现出了多种非随机性的架构特征,如长尾分布、相互隔离的社区和密集互连的核心。然而,我们仍然不清楚包含运算能力在内的专业功能是如何从中涌现的。

8月9日发表在Nature Machine Intelligence的一篇文章使用扩散加权成像重构人脑连接组,并使用储层计算将其实现为人工神经网络。随后训练该网络完成记忆编码任务。研究表明,生物学上的真实神经网络架构在显示关键动力学时表现最佳。其性能由网络拓扑驱动,且内在网络的模块化结构在计算上是相关的。文章观察到网络结构与动力学之间存在着显著的相互作用,因此针对网络所遵循的具体动力学,相同的底层架构可以支持巨大的记忆容量以及不同的功能(编码或解码)。该工作为发现大脑网络优化认知能力的方式开辟了新的机会。

图1.测量生物神经网络的记忆容量。


3.马尔可夫链

和网络块模型中的状态聚合


论文题目:State Aggregations in Markov Chains and Block Models of Networks期刊来源:Physical Review Letters论文地址:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.127.078301

由大量主体相互作用形成的动力系统通常具有庞大的状态空间,表现出复杂的动力学特性。处理这种复杂性的一种技术是通过合适映射将时间序列的系统状态投影到更小的空间,并将原来的动力学替换为更简单的动力学。这种技术在物理和其他领域中比比皆是,如模型降阶、粗粒化、变量或状态聚合、模式分解或降维。

8月12日发表在Physics Review Letters的封面文章以信息论的视角开发了一种平稳马尔可夫过程的状态聚合方法。该方法通过最大化互信息来确定马尔可夫链状态的映射。研究证明当T=1时,该方法和度修正随机块模型(degree-corrected stochastic block model,一种用于网络中社群结构识别的技术)等价,并从动力学角度指出度修正随机块模型假设的内在问题,而引入时间参数 T 可缓解该问题,并使得方法更适用于在长时间尺度上涌现出趋势的轨迹数据。最后,研究分析了真实洋流数据,揭示了海面洋流在长时间尺度上的主导模式,说明了该方法的有效性。

图1.海面洋流的状态聚合。该图比较了较短时间尺度(上图,T=1)与较长时间尺度(下图,T=10)内海面洋流状态聚合的结果。在较短的时间尺度上,洋流展现出更多状态;在较长的时间尺度上,聚合的状态揭示了全球海洋动力学众多已知特征,如南极环流、亚热带环流,以及极地、中纬度和赤道区域的显著分离。该结果中每个时间步长 t 对应 16 天。



4.从大流行出现到地方性转变的

人口学特征的一般模型


论文题目:A general model for the demographic signatures of the transition from pandemic emergence to endemicity期刊来源:Science Advances论文地址:https://advances.sciencemag.org/content/7/33/eabf9040

由冠状病毒引起的流行病有可能成为我们这个时代最大的挑战之一。越来越多的证据表明,在可预见的未来,疾病将不可避免地卷土重来 。对于许多人类病原体,疾病负担取决于年龄及接触情况,因此了解人口统计和传播动力学之间的交互至关重要,有助于应对冠状病毒流行病或未来新出现的病原体。

8月11日发表在Science Advances上的文章开发了一个年龄结构数学模型,整合了人口统计学、社会传播学和免疫学,以确定未来各年龄段疾病发生率和死亡率的合理范围。针对COVID-19,该模型在疾病成为季节性地方流行病时识别到了风险的年龄结构转变。该研究使用现实世界不同的人口统计学和年龄结构数据混合来训练模型,以限制对不断变化的年龄发病率和疾病负担的期望。该研究的数学框架十分灵活,可以帮助在世界各地具有不同人口和社会模式的国家制定策略。

图1.感染率随流行病传播过程的变化和相对风险的年龄结构转变。


5.多感觉神经元如何解决因果推理


论文题目:How multisensory neurons solve causal inference期刊来源:PNAS论文地址:https://www.pnas.org/content/118/32/e2106235118

大多数生物有机体具有接收感知环境的多个独立输入源(如视觉、前庭、听觉、体感等)。大脑面临的一个基本挑战是,决定多个信号是由相同的事件还是不同的事件产生(即解决因果推理问题)。感官信号是嘈杂的,通常是模棱两可的,因此将同一事件引起的多个信号组合在一起可以提高感知世界的精度。然而,错误地组合由不同事件引起的信号会降低感知与环境之间的对应关系。

在感知运动时,许多脊椎动物通过前庭系统中液体流动传导的信号检测头部平移及旋转加速,同时,视网膜感知光的变化来检测运动。当环境稳定时,两种信号的表征可以结合起来产生更精确的自运动表征。然而,通常环境也在运动(例如,水在地面上移动或云在天空中移动),这意味着视觉输入提供了自身运动和场景运动的不确定组合。在这种情况下,前庭和视觉信号会有所不同,必须仅从前庭信号中推断出自身运动,而从两个信号之间的差异中推导出场景运动。中枢神经系统的任务是决定信号何时由相同或不同的事件产生(即何时整合或分离感觉输入)。生物系统能够以相当高的准确度自动执行因果推理,但支持这项任务的神经计算仍然未知。

8月10日发表于PNAS的文章使用人工系统方法训练神经网络,通过组合或分离视觉和前庭输入来解决因果推理,以估计自身运动和场景运动。研究发现人工系统中出现的单元具有与生物系统中单元相匹配的特性(即一致神经元和相反神经元),并且该网络展现了在人类和灵长类动物研究中观察到的关键“行为”特征,例如基于可靠性的线索加权和因果推断产生的自我运动估计。研究表明,虽然一致神经元和相反神经元分别主要支持自我和场景运动的估计,但两种神经元的活动都有助于运动表示,并且我一致神经元和相反神经元活动之间的平衡决定了视觉和前庭信号分离或组合(即解决因果推断)。该研究结果解释了如何在生物系统中解决因果推理,并解释了相反神经元的作用。

图1.用多感官神经网络解决因果推理。(A)通过两种情况说明估计运动必须解决因果推断。在第一种情况下(上图),你坐在火车上并接收到你正在前进的视觉和前庭信号,这些单感觉信号可以表示为速度的概率分布,组合这些信号能够更准确地表示你自身的运动(自身运动为绿色分布),假设环境没有移动(场景运动为洋红色分布),你会推断这些信号是由相同的事件产生(即你的火车正在前进)。在第二种情况下( 底部 ),你会收到一个表示你正在向前移动的视觉信号和一个表示你处于静止状态的前庭信号。你从前庭信号中推断出自身运动,而从两个信号之间的差异中推导出场景运动,由此你推断两信号是由不同的事件引起的(即另一列火车正在移动)。(B)网络包含两个输入流:视觉(蓝色)和前庭(橙色)。视觉信号流由一个输入层、一个卷积层(V1) 和一个全连接层(MT)层组成。前庭信号流由输入层和全连接层(PIVC)层组成。这些信号流汇聚在一个公共的全连接层(MSTd)层上。MSTd层的活动由四个“融合”回归单元解码以产生自身运动的估计,四个“分离”回归单元解码以产生场景运动的估计,以及四个二进制“因果推断”单元来决定信号(Vx、Vy、Vz、Vr)是否由同一事件产生。



6.量化复杂网络的可压缩性


论文题目:Quantifying the compressibility of complex networks期刊来源:PNAS论文地址:https://www.pnas.org/content/118/32/e2023473118

大脑对语言、知识 、音乐等进行编码, 类似地,分子和细胞成分之间的生物网络在遗传物质中以不同的尺度进行编码,复杂网络在生物学中的编码提出了一个基本问题:网络结构如何促进高效编码?高效的编码在简单性和准确性之间取得最佳平衡,故高效编码就是对信息进行有效压缩。

8月10日发表在PNAS上的文章采用信息论中的工具,量化真实网络及模型网络的可压缩性,发现网络可压缩性随其聚类系数和度异质性而增加,表明以模块化结构和异构程度为特征的分层组织促进了复杂网络的压缩。鉴于聚类程度和度异质性是各种网络最基本的特征,有理由假设演化促进了真实网络可压缩性的增加,未来工作可研究真实网络可压缩性是否随着时间推移而增加,从而验证假设。进一步,人们可以设计最佳可压缩人工网络,并确定自然界和社会中真实网络与最佳网络的接近程度。该研究为这些问题提供了定量工具。

图1.可压缩性随着聚类系数和度异质性而增加。




集智新栏目 Complexity Express

上线啦!




Complex World, Simple Rules.
复杂世界,简单规则。
复杂性科学(Complexity Science)是集智俱乐部多年以来的主题,我们长期追踪关于自然、生命、社会、认知等各类复杂系统的研究进展,并组织学术研讨。
 
同时由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。
 
为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统的最新顶刊论文。
 

Complexity Express 是什么?

Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“集智斑图”服务号汇总推送。
 
进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。

               


Complexity Express 为谁服务?

  • 如果你是复杂系统领域的研究者,可获得重要论文上线通知,每周获取最新顶刊论文汇总。

  • 如果你是复杂系统领域的学习者,可了解学界关注的前沿问题,把握专业发展脉络。

  • 如果你是传统的生命科学、社会科学等学科中的研究者/学习者,可以从复杂性科学和跨学科研究中获得灵感启发。

  • 如果你是关注前沿研究发现的知识猎手,可获得复杂系统研究对自然和人类世界的最新洞见。
Complexity Express 栏目也是集智俱乐部公众号的主要选题来源,诚挚邀请你订阅,与我们信息同步。
 

Complexity Express 论文从哪里来?

考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。
 
Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:
  • Nature

  • Science

  • PNAS

  • Nature Communications

  • Science Advances

  • Physics Reports

  • Physical Review Letters

  • Physical Review X

  • Nature Physics

  • Nature Human Behaviour

  • Nature Machine Intelligence

  • 更多期刊持续增补中,欢迎推荐你认为重要的期刊!
 
如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~
 

Complexity Express 追踪哪些领域?

我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:
  • 网络科学各个分支及交叉应用

  • 图数据与图神经网络

  • 计算机建模与仿真

  • 统计物理与复杂系统理论

  • 生态系统、进化、生物物理等

  • 系统生物学与合成生物学

  • 计算神经科学与认知神经科学

  • 计算社会科学与社会经济复杂系统

  • 城市科学

  • 科学学

  • 计算流行病学

  • 以及一些领域小众,但有趣的工作
 
由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。
 
将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!
 
由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们(小助手微信:swarmaAI),帮助我们持续优化算法。

如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生(具体请邮件联系算法组负责人huqiao@swarma.org)

如果你对复杂性科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队(具体请邮件联系编辑部负责人liupeiyuan@swarma.org)




更多论文




更多复杂性顶刊论文,请到Complexity Express页面查看。订阅即可每周获取更新提醒。
       


点击“阅读原文”,追踪复杂科学顶刊论文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存